Datascience para el Bien Social
  • Home
  • Categories
  • Tags
  • Archives

Aprendiendo a Visualizar datos con Seaborn y Python.

Aprendiendo a Visualizar datos con Seaborn y Python.¶

En este proyecto vamos a mostrar algunas muestas de como usar seaborn para obtener mejores visualizaciones.¶

- Vamos a ver:
    - Crear un Histograma.
    - Generar graficos de densidad.
    - Modificar la apariencia de los graficos.
    - Distribucion condicional usando una sola condicion, dos y tres condiciones.
    - Añadir una legenda para visualizar los datos.

Creando un Histograma con Seaborn.¶

In [5]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

titanic = pd.read_csv("train.csv")
cols = ['Survived', 'Pclass', 'Sex', 'Age', 'SibSp', 'Parch', 'Fare', 'Embarked']

titanic = titanic[cols].dropna()

sns.distplot(titanic["Age"])
plt.show()
E:\Anaconda3\lib\site-packages\statsmodels\nonparametric\kdetools.py:20: VisibleDeprecationWarning: using a non-integer number instead of an integer will result in an error in the future
  y = X[:m/2+1] + np.r_[0,X[m/2+1:],0]*1j

Generando un Kernel Density Plot¶

In [2]:
sns.kdeplot(titanic["Age"], shade="true")
plt.xlabel("Age")
plt.show()
E:\Anaconda3\lib\site-packages\statsmodels\nonparametric\kdetools.py:20: VisibleDeprecationWarning: using a non-integer number instead of an integer will result in an error in the future
  y = X[:m/2+1] + np.r_[0,X[m/2+1:],0]*1j

Modificando la apariencia de los graficos.¶

In [3]:
sns.set_style("white")
sns.kdeplot(titanic["Age"], shade="true")
sns.despine(left="true", bottom="true")
plt.xlabel("Age")
E:\Anaconda3\lib\site-packages\statsmodels\nonparametric\kdetools.py:20: VisibleDeprecationWarning: using a non-integer number instead of an integer will result in an error in the future
  y = X[:m/2+1] + np.r_[0,X[m/2+1:],0]*1j
Out[3]:
In [4]:
plt.show()

Distribucion condicional usando una unica condicion.¶

In [7]:
g = sns.FacetGrid(titanic, col="Pclass", size = 6)
g.map(sns.kdeplot, "Age", shade="true")
sns.despine(left="true", bottom="true")
plt.show()
E:\Anaconda3\lib\site-packages\statsmodels\nonparametric\kdetools.py:20: VisibleDeprecationWarning: using a non-integer number instead of an integer will result in an error in the future
  y = X[:m/2+1] + np.r_[0,X[m/2+1:],0]*1j

Distribucion condicional usando dos condiciones.¶

In [8]:
g = sns.FacetGrid(titanic, col="Pclass", row="Survived")
g.map(sns.kdeplot, "Age", shade=True)
sns.despine(left=True, bottom=True)
plt.show()
E:\Anaconda3\lib\site-packages\statsmodels\nonparametric\kdetools.py:20: VisibleDeprecationWarning: using a non-integer number instead of an integer will result in an error in the future
  y = X[:m/2+1] + np.r_[0,X[m/2+1:],0]*1j

Distribucion condicional usando tres condiciones.¶

In [9]:
g = sns.FacetGrid(titanic, col="Survived", row="Pclass", hue="Sex")
g.map(sns.kdeplot, "Age", shade=True)
sns.despine(left=True, bottom=True)
plt.show()
E:\Anaconda3\lib\site-packages\statsmodels\nonparametric\kdetools.py:20: VisibleDeprecationWarning: using a non-integer number instead of an integer will result in an error in the future
  y = X[:m/2+1] + np.r_[0,X[m/2+1:],0]*1j

Añadiendo la leyenda para nuestros graficos.¶

In [11]:
g = sns.FacetGrid(titanic, col="Survived", row="Pclass", hue="Sex")
g.map(sns.kdeplot, "Age", shade=True).add_legend()
sns.despine(left=True, bottom = True)
plt.show()
E:\Anaconda3\lib\site-packages\statsmodels\nonparametric\kdetools.py:20: VisibleDeprecationWarning: using a non-integer number instead of an integer will result in an error in the future
  y = X[:m/2+1] + np.r_[0,X[m/2+1:],0]*1j

http://seaborn.pydata.org/generated/seaborn.FacetGrid.html#seaborn.FacetGrid

In [ ]:
 

Published

mar. 3, 2017

Category

Data Visualization

Tags

  • Data Visualization 5
  • Matplotlib 5
  • Python 10
  • Seaborn 1

Stay in Touch

Get Monthly Updates

  • Powered by Pelican. Theme: Elegant by Talha Mansoor